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Stuttgart, den 11. Mai 2000 

Universitat Stuttgart 
Keplerstrafie 7, D-70174 Stuttgart 

Verfahren zur Erhohung der Leistungsfahigkeit 
einer Computereinrichtung bei Finite-Elemente-Simulationen 
und eine solche Computereinrichtung 

Die Erfindung betrifft ein Verfahren zur Erhohung der Leistungsfahigkeit einer 
Computereinrichtung bei Finite-Elemente-Simulationen durch efhziente 
automatische Konstruktion geeigneter Basisfunktionen fur die Berechnung von 
Naherungslosungen und eine solche Computereinrichtung. 

5 

Eine Vielzahl technisch-physikalischer Phanomene lasst sich durch partielle 
Differenzialgleichungen beschreiben. Hierunter fallen u.a. Probleme aus der 
Stromungsmechanik (z.B. Stromung um eine Tragflache), der elektromagnetischen 
Feldtheorie (z.B. elektrischer Feldverlauf in einem Transistor) oder der 

10 Elastizitatstheorie (z.B. Deformation einer Autokarosserie). Die genaue Kenntnis 
und Beschreibung derartiger Vorgange ist ein zentraler Bestandteil bei der 
Konstruktion und Optimierung technischer Objekte. Um zeit- und kostenintensive 
Experimente einzusparen ist das Interesse an computergestiitzten Simulationen 
grofi. Hierbei haben sich Finite-Elemente- Verfahren (FE- Verfahren) etabliert und 

15 sind seit langem Gegenstand intensiver Forschung. Dies betrifft insbesondere auch 
automatische Netzgenerierungsverfahren als Grundlage fur die Konstruktion 
geeigneter Basisfunktionen. 
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Fig. 1 veranschaulicht in der linken Bildhalfte den Stand der Technik beim Ablauf 
einer FE-Simulation fur ein lineares Randwertproblem als typisches Modellbeispiel. 
Ausgehend von den Daten, die die Geometrie des zu simulierenden technischen 
Objektes beschreiben, wird zunachst ein System von Basisfunktionen konstruiert, 
5 das einerseits die Einhaltung der Randbedingungen ermoglicht und andererseits 
zur Approximation der gesuchten Losung geeignet ist. Dann wird mit Hilfe dieser 
Basisfunktionen ein lineares Gleichungssy stern mittels numerischer 
Integrationsverfahren aufgestellt. Schliefilich werden die Koemzienten der 
gesuchten Approximation als Losung dieses linearen Gleichungssystems ermittelt. 

10 

FE- Verfahren oder deren Anwendung sind Gegenstand einer Reihe von Patenten. 
Beispielhaft sei US 4,819,161 genannt, wo die FE-Approximationen einer grofien 
Klasse von Differ en ziaigleichungen automatisiert wefden, sowie US 5,731,817, wo 
ein Verfahren zur Generierung von Hexaeder-Netzen die Grundlage fur ein 
15 Verfahren zur FE-Simulation bildet. 

Bei den meisten praxisrelevanten FE- Verfahren werden Basisfunktionen verwendet, 
die auf einer durch Vernetzung des Simulationsgebietes erzeugten Zerlegung 
definiert sind. Fig. 2a zeigt eine Auswahl gebrauchlicher Elemente deren 

20 Dimension, Grad, Glattheit und Parameter in Fig. 2b aufgelistet sind. Eine 

Ubersicht iiber Vernetzungsmethoden ebener Gebiete findet sich beispielsweise in 
K. Ho-Le, Finite element mesh generation methods: a review and classification, 
Comp. Aided Design 20 (1988), 27-38. Die Vernetzung komplizierterer 
dreidimensionaler Gebiete gestaltet sich nach derzeitigem Kenntnisstand iiberaus 

25 schwierig, wie S. Owen, A survey of unstructured mesh generation technology, 

Proceedings, 7th International Meshing Round Table, Sandia National Lab (1998), 
239-257, zeigt. Die Verfahren benotigen lange Rechenzeiten und sind teilweise auch 
noch nicht vollkommen automatisiert. Es gibt jedoch in jungerer Zeit eine Reihe 
sehr innovativer neuer Ansatze. Beispielsweise wird in A. Fuchs, Optimierte 

30 Delaunay-Triangulierungen zur Vernetzung getrimmter NURBS-Korper, 
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Universitat Stuttgart, 1999 eine Krafteverteilung simuliert, um eine optimale 
Verteilung von Triangulierungspunkten zu erzielen. In US 5,729,670 werden zwei- 
und dreidimensionale Netze durch Losen von Stromungsproblemen erzeugt, was 
eine interessante Umkehrung des iiblichen FE-Mechanismusses ist. Daneben 
5 wurden viele Algorithmen entwickelt, um einzelne Teilaspekte der Netzgenerierung 
zu verbessern. Beispielsweise wird in DE 196 21 434 Al und US 5,774,696 ein 
Verfahren zur Elimination von Uberschneidungen mit vorgegebenen Kanten oder 
Grenzflachen bei Delaunay-Triangulierungen beschrieben. 

10 Vernetzungsfreie FE- Verfahren haben bisher keine Bedeutung fur die 

Anwendungen erlangt. Sowohl bei dem Lagrange- Multiplier- Verfahren, s. z.B. 
J.H. Bramble, The Lagrange multiplier method for Dirichlet's problem, Math. 
Comp. 37 (1981), 1-11, als auch bei der Penalty-Methode, s. z.B. P. Bochev und 
M. Gunzburger, Finite element methods of least squares type, SIAM Review 40 

15 (199S), 789-837, stellt bei Verwendung einfacher, stabiler Basisfunktionen die 
Behandlung von Randbedingungen ein Hauptproblem dar. 

Bei vielen technischen Simulationen ist die automatische Netzgenerierung sehr 
aufwendig und nimmt den weitaus grofiten Teil der Rechenzeit in Anspruch. Des 

20 Weiteren ist die Approximationskraft der ublicherweise verwendeten linearen und 
multilinearen Basisfunktionen gering. Um genaue Resultate zu erzielen, muss also 
eine grofie Anzahl von Basisfunktionen verwendet und damit ein entsprechend 
grofies Gleichungssystem gelost werden. Ansatzfunktionen hoheren Grades iiber 
Triangulierungen besitzen in der Regel ebenfalls ein ungiinstiges Verhaltnis 

25 zwischen der erreichbaren Genauigkeit und der Anzahl der verwendeten 

Basisfunktionen. Schliefilich lassen sich auf unstrukturierten Netzen keine glatten 
Basisfunktionen auf einfache Weise defmieren. Bereits fur stetig differenzierbare 
Elemente sind sehr spezielle Konstruktionen notwendig (s. Fig. 2a). 
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Der Erfindung liegt das Problem zugrunde, die Leistungsfahigkeit bekannter 
FE-Verfahren und die FE-Verfahren ausfiihrender Computereinrichtungen durch 
die effiziente Konstruktion von Basisfunktionen mit giinstigen Eigenschaften zu 
erhohen. Insbesondere soil die Vernetzung des Simulationsgebietes vollstandig 
5 entfallen, eventuell gegebene Randbedingungen eingehalten werden, genaue 
Losungen mit relativ wenigen Koeffizienten erreichbar und das entstehende 
Gleichungssystem efflzient losbar sein. Dadurch sollen die Nachteile des Standes 
der Technik iiberwunden und somit die Genauigkeit und Geschwindigkeit der 
Simulation physikalischer Eigenschaften bei der Konstruktion und Optimierung 
10 technischer Objekte verbessert werden. 

Einige zentrale Begriffe und Bezeichmmgen, die in der nachfolgenden Beschreibung 
des erfindungsgemafien Verfahrens verwendet werden, sollen vorab erlautert 
werden. 

15 

Das Simulationsgebiet H ist eine beschrankte Menge der Dimension d = 2 oder 
d = 3, auf der die zu untersuchenden physikalischen Groflen mittels der 
FE-Methode approximiert werden sollen. Der Rand des Simulationsgebietes wird 
mit T bezeichnet. Unter einem Gitter mit Gitterweite h versteht man eine 

20 Zerlegung einer Teilmenge der Ebene oder des Raumes in Gitterzellen Z k . Dabei 
ist jede Gitterzelle je nach Dimension d ein Quadrat oder ein Wiirfel mit 
Kantenlange h. Genauer gilt Z k = kh + [0, h] d , wobei k eine Menge von 
ganzzahligen d-Vektoren durehlauft. Die uniformen Tensorprodukt B-Splines in d 
Variablen vom Grad n zur Gitterweite h werden mit b k bezeichnet, s. z.B. C. de 

25 Boor, A Practical Guide to Splines, Springer, 1978. Dies sind (n - l)-mal stetig 
difFerenzierbare Funktionen, die auf den Gitterzellen mit Polynomen vom Grad n 
ubereinstimmen, wie in Fig. 4 dargestellt. Die obere Bildhalfte zeigt einen Trager 
Q k des B-Splines vom Grad n = 2, der Dimension d = 2 und der Glattheit m = 1. 
In der unteren Bildhalfte ist der resultierende Tensorprodukt B-Spline 6* 

30 abgebildet Der Trager Q k , also die Vereinigung aller Gitterzellen, auf denen der 
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B-Spline bk nicht identisch Null ist, besteht aus (n + l) d Gitterzellen; es gilt 
genauer Q k = kh + [0, (n + l)h] d . In alien Figuren ist der B-Spline b k an der S telle 
kh markiert, also beispielsweise im Fall d = 2 in der linken unteren Ecke des 
Tragers. Fiir die FE-Simulation sind nur solche B-Splines von Belang, deren Trager 
5 das Simulationsgebiet Cl schneiden; sie werden als relevante B-Splines bezeichnet. 
Die relevanten B-Splines werden nochmals in zwei Gruppen eingeteilt: diejenigen 
B-Splines, bei denen der Teil des Tragers im Inneren des Simulationsgebietes 
grofier als eine vorgegebene Schranke s ist, werden als innere B-Splines bezeichnet. 
Alle ubrigen relevanten B-Splines werden als aufiere B-Splines bezeichnet. 

fir io 

Die Aufgabe der vorliegenden Erflndung wird durch das im Anspruch 1 bestimmte 
Verfahren gelost. Besondere Ausfiihrungsarten der Erflndung sind in den 
Unteranspruchen bestimmt. Der Anspruch 11 bestimmt eine erfindungsgemafi'e 
Computereinrichtung. 

15' 

In der rechten Bildhalfte der Fig. 1 ist die Einbindung des erfindungsgemafien 
Verfahrens in den Ablauf einer FE-Simulation nach dem Stand der Technik bzw. 
die Substitution einiger Verfahrensschritte einer FE-Simulation nach dem Stand 
der Technik durch das erfin dungs gem afle Verfahren dargestellt. 

/ 20 

Die Eingabe 1 des Simulationsgebietes Q kann iiber ein Eingabemittel erfolgen, 
insbesondere auch durch Einspeichern von Daten, die aus einer 
computerunterstutzten Konstruktion (CAD/CAM) abgeleitet sind. Beispielsweise 
konnen so die bei der Konstruktion eines Kraftfahrzeugs verwendeten Daten 
25 unmittelbar in die erfmdungsgemafle FE-Simulation einfliefien. 

Bei der Eingabe 2 und Abspeicherung des Typs der Randbedingungen wird 
zwischen naturlichen und wesentlichen Randbedingungen unterschieden. Die 
erfindungsgemafie Basis wird fiir homogene Randbedingungen gleichen Typs 
30 konstruiert. Insbesondere verschwinden bei wesentlichen Randbedingungen die 



Basisfunktionen auf dem Rand I\ Inhomogene Randbedingungen lassen sich dann 
beim Aufstellen des FE-Systems mittels Methoden, die dem Stand der Technik 
entsprechen, behandeln. 

SchlieBlich werden Steuerparameter eingelesen 3. Diese betreffen den Grad n und 
die Gitterweite h der zu verwendenden B-Splines sowie die Schranke s zur 
Klassifikation der inneren und aufieren B-Splines. Bei fehlender Spezifikation 
konnen alle diese Eingabeparameter mit Hilfe von empirisch oder analytisch 
konstruierten Bewertungsfunktionen automatisch bestimmt werden. 

Die folgende erfindungsgemafie Konstruktion der Basisfunktionen gliedert sich in 
die in Fig. 3 schematisch dargestellten Schritte, die nun beschrieben werden..* 

Nach dem Einlesen des Simulationsgebietes H wird im ersten Verfahrensschritt ein 
das Simulationsgebiet Q viberdeckendes Gitter erstellt. Dann wird gepriift, welche 
der Gitterzellen ganz, teilweise oder nicht im Simulationsgebiet H liegen, die 
Zelltypen bestimmt 4 und diese Information iiber die Zelltypen gespeichert. Hierzu 
sind im Wesentlichen Innen/Auften-Tests sowie Schnittbestimmungen zwi'schen 
dem Rand V des Simulationsgebietes fl und den Strecken bzw. Quadraten, die die 
Gitterzellen beranden, durchzufiihren. Fig. 7 zeigt die Ein- und Ausgabedaten fur 
diesen Verfahrensschritt. 

Im zweiten Verfahrensschritt werden zunachst anhand der Information iiber die 
Zelltypen die relevanten B-Splines bestimmt. Dann wird die Klassifikation 5 in 
innere und auflere B-Splines durchgefiihrt; die entsprechenden Listen der Indizes 
werden mit / und J bezeichnet. Hierzu ist mit Hilfe der im ersten 
Verfahrensschritt gewonnenen Daten die Grofie derjenigen Teile der Trager der 
B-Splines zu bestimmen, die im Inneren des Simulationsgebietes liegen und mit der 
vorgegebenen Schranke s zu vergleichen. Fig. 9 zeigt die Ein- und Ausgabedaten 
fur diesen Verfahrensschritt. 
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Im dritten Verfahrensschritt werden Kopplungskoeffizienten e iyj berechnet 6, die 
innere und auflere B-Splines gemafi der Vorschrift 

Bi(x) = bi(x) + e iJ b i(x), * e / (1) 

3€J(i) 

5 verbinden. Jedem inneren B-Spline wird damit ein erweiterter B-Spline B{ 

zugeordnet. Die Konstruktion und die Eigenschaften der Indexmengen J(i) und der 
Kopplungskoeffizienten e t(J sind wie folgt gegeben. Die Indexmengen J(i) bestehen 
aus Indizes aufierer B-Splines. Ihnen entsprechen komplementare Indexmengen 

von Indizes innerer B-Splines; es gehort also i genau dann zu wenn j zu 

10 J(i) gehort. Fiir einen gegebenen aufieren Index j ist die Indexmenge I(j) ein Feld, 
also ein quadratischer bzw. wiirfelformiger Bereich von (n 4- l) d inneren Indizes, 
der durch einen minimalen Abstand zum Index j gekennzeichnet ist. Fiir einen 
gegebenen aufieren Index j und einen inneren Index i in der Indexmenge sei pi 
dasjenige rf-variate Polynom vom Grad n in jeder Variablen, das an der Stelle i den 

15 Wert 1 und an alien anderen Punkten des Feldes den Wert 0 hat. Dann ist. der 
Kopplungskoeffizient e (iJ - als Wert von pi an der Stelle j gegeben, es gilt also 
e »j — PiU)- Die konkreten Werte der Kopplungskoeffizienten konnen entweder fiir 
verschiedene Grade und relative Positionen von j und tabelliert werden oder 
aber mit Hilfe von Lagrangepolynomen einfach berechnet werden. Fig. 11 zeigt die 

20 Ein- und Ausgabedaten fiir diesen Verfahrensschritt. 



Sind naturliche Randbedingungen gegeben, so werden die in Gleichung (1) 
defmierten erweiterten Splines ohne Modifikation zur weiteren Durchfuhrung des 
FE-Verfahrens verwendet. Sind dagegen wesentliche Randbedingungen gegeben, so 
25 ist noch eine Gewichtung gemafi der Vorschrift 

durchzufiihren. Die zugehorige Abfrage erfolgt in einem optionalen 
Verfahrensschritt 6a. Die so definierten Funktionen werden als gewichtete 



erweiterte B-Splines (WEB-Splines) bezeichnet. Formal gesehen entsprechen die 
bei natiirlichen Randbedingungen verwendeten erweiterten B- Splines dem 
Sonderfall w(x) = 1. Sie werden deshalb ebenfalls als WEB-Splines bezeichnet. Fur 
den Fall wesentlicher Randbedingungen ist die Gewichtsfunktion w wie folgt 
gekennzeichnet: Fur alle Punkte x des Simulationsgebietes lasst sich w(x) nach 
oben und unten durch von x unabhangige positive Konstanten mal den Abstand 
dist(x) des Punktes x vom Rand T abschatzen. Mit anderen Worten ist w im 
Inneren von ft positiv und verschwindet in der Nahe des Randes V so schnell wie 
die Abstandsfunktion dist. Fiir Simulationsgebiete, die durch elementare 
geometrische Objekte (Kreise, Ebenen, Ellipsen, etc.) berandet sind, kann eine 
geeignete Gewichtsfunktion gegebenenfalls in expliziter analytischer Form 
angegeben werden. Anderenfalls sind Berechnungsvorschriften heranzuziehen, die 
typischerweise eine Glattung der Abstandsfunktion darstellen. Der 
Skalierungsfaktor l/w(xi) entsteht durch Auswertung der Gewichtsfunktion im 
Gewichtspunkt x { . Dies kann ein beliebiger Punkt im Trager des B-Splines 6,- sein, 
der vom Rand mindestens den halben Schrankenwert s/2 entfernt ist. 

Als Resultat des erfindungsgemafien Verfahrens erhalt man eine 
Berechnungsvorschrift fiir die WEB-Splines B, (vgl. Deiinitionen (1) und (2)), die 
alle giinstigen Eigenschaften gemafi der Aufgabenstellung aufweisen. Damit kann 
nun das FE-Verfahren gemafi dem Stand der Technik weitergefuhrt werden. Es ist 
dabei jedoch mdglich, nach Anspruch 11 die regulare Gitterstruktur der 
Basisfunktionen vorteilhaft auszunutzen. 

Zusamrrienfassend ist zu sagen, dass fiir das erfindungsgemafie Verfahren unter 
anderem die Kopplung der aufieren an die inneren B-Splines von Bedeutung ist. 
Diese bewirkt, dass die konstruierte Basis die fiir FE-Berechnungen wesentlichen 
Eigenschaften besitzt. Insbesondere ist eine erfindungsgemafie Basis B{ (i aus der 
Indexmenge /) gleichmafiig in Bezug auf die Gitterweite h stabil und besitzt die 
gleiche Fehlerordnung wie die B-Splines b k bei Approximation glatter Funktionen, 
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die die gleichen Randbedingungen erfullen. Zum anderen ist durch die Verwendung 
der Gewichtsfunktion w die Einhaltung wesentlicher Randbedingungen 
gewahrleistet. 
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5 Die zuvor beschriebenen Verfahrensschritte und deren Eigenschaften sowie die 
bevorzugte Ausfuhrungsart und die zugehorigen Ausfiihrungsbeispiele sollen mit 
Hilfe der nachfolgend aufgelisteten Figuren weiter erlautert bzw. illustriert werden. 
Dabei konnen die in den Anspriichen und in der Beschreibung erwahnten 
Merkmale jeweils einzeln fiir sich oder in beliebiger Kombination 
10 erfln dungs wesentlich sein. 

Fig. 1 zeigt zum Stand der Technik die einzelnen Schritte beim Ablauf 

einer Finite-Elemente- Simulation und ordnet die erfmdungsgemafie 
Ermittlung der WEB-Basis in diesen Ablauf ein, 

Fig. 2a stellt einige Finite Elemente des Standes der Technik dem in 
15 Fig. 2b gezeigten WEB-Element gegenuber und listet die fiir 

Finite- Elemente- Approximationen relevanten Parameter auf, 

Fig. 3 zeigt in einem Flussdiagramm die Verfahrensschritte zur 
Ermittlung der WEB-Basis, 

Fig. 4 zeigt einen Trager und den zugehorigen Tensorprodukt-B-Spline 
20 vom Grad 2, 

Fig. 5 illustriert die Problemstellung des ersten Ausfuhrungsbeispiels 

(Auslenkung einer Membran unter konstantem Druck) und zeigt 
die zugehorige Losung, 

Fig. 6 zeigt die Zelltypen anhand des ersten Ausfuhrungsbeispiels, 
25 Fig. 7 gibt eine Ubersicht der Ein- und Ausgabedaten des Verfahrens zur 
Bestimmung der Zelltypen, 

Fig. 8 illustriert exemplarisch die Klassifikation der B-Splines anhand des 
ersten Ausfuhrungsbeispiels, 
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Fig. 9 gibt eine Ubersicht der Ein- und Ausgabedaten des Verfahrens zur 
Klassifikation der B-Splines, 

Fig. 10 zeigt die Kopplungskoeffizienten eines aufleren B-Splines und die 
zugehorigen inneren B- Splines anhand des ersten 
5 Ausfiihrungsbeispiels, 

Fig. 11 gibt eine Ubersicht der Ein- und Ausgabedaten des Verfahrens zur 
Berechnung der Kopplungskoeffizienten, 

Fig. 12 illustriert die Konstruktion der Gewichtsfunktion der bevorzugten 
Ausfuhrungsart, 

10 Fig. 13 zeigt den Trager eines WEB-Splines und die zugehorigen 

Kopplungskoeffizienten anhand des ersten Ausfiihrungsbeispiels, 
Fig. 14 erlautert die Problemstellung eines zweiten Ausfiihrungsbeispiels 
(inkompressible Strdmung) und deren Losung anhand der 
Stromungslinien und einer Abbildung zur Verteilung der 
15 Stromungsgeschwindigkeit, 

Fig. 15a bis 15c zeigen fur das zweite Ausfiihrungsbeispiel zu den 

B-Spline-Graden n = 1,2,3 und gleicher Gitterweite die sich 
andernde Klassifikation der B- Splines, 
Fig. 16a bis 16c geben Auskunft iiber die Fehlerentwicklung bei der 
20 Finite- Elemente- Approximation mit Hilfe von WEB-Splines sowie 

iiber das Laufzeitverhalten der WEB-Approximation fur das zweite 
Ausfiihrungsbeispiel, 

Fig. 17 stellt die WEB-Basis einem auf linearen Ansatzfunktionen iiber 
einer Triangulierung (Stand der Technik) basierenden Verfahren 
25 gegeniiber und 

Fig. 18 zeigt eine ernndungsgemafie Computereinrichtung. 

Eine besonders giinstige Ausfuhrungsart des erfmdungsgemaflen Verfahrens, die als 
WEB- Verfahren bezeichnet wird, ist durch folgende Festlegungen gegeben: 



Die Schranke s wird so gewahlt, dass die inneren B-Splines dadurch 
gekennzeichnet sind, dass mindestens eine der Gitterzellen ihres Tragers 
vollstandig im Simulationsgebiet H liegt. Da zur Bestimmung der relevanten 
B-Splines ohnehin der Schnitt zwischen den Gitterzellen und dem Rand V zu 
berechnen ist, ist somit zur Klassifizierung kein wesentlicher zusatzlicher 
Rechenaufwand notwendig. Der Gewichtspunkt X{ wird als Mittelpunkt einer 
vollstandig im Simulationsgebiet Q liegenden Gitterzelle im Trager des B-Splines 6 t 
gewahlt. Auch dies ist emzient moglich, da die Bestimmung einer solchen Zelle 
bereits Bestandteil der Klassifizierungsroutine ist. 

Falls keine explizite analytische Form der Gewichtsfunktion bekannt ist, wird diese 
wie folgt angesetzt: 

{1 falls dist(z) > S 

(3) 
1 - (1 - dist(x)/S) n falls dist(x) < S 

Fig. 12 illustriert die Konstruktion der Gewichtsfunktion. Dabei gibt der 

Parameter 8 die Breite eines Streifens fts an, innerhalb dessen die 

Gewichtsfunktion zwischen dem Wert 0 auf dem Rand des Simulationsgebietes und 

dem Wert 1 auf einem Plateau viber variiert. Der Parameter 6 wird so 

bestimmt, dass die Glattheit der Gewichtsfunktion gewahrleistet ist. 

Ein wesentlicher Vorteil des Verfahrens ist, dass keine Vernetzung des 
Simulationsgebietes erforderlich ist. Dies bewirkt in technischen Anwendungen eine 
deutliche Ersparnis an Rechenzeit und Speicherkapazitat und vereinfacht den 
Simulationsablauf. Dabei ist die Verfahrensstruktur fur zwei- und dreidimensionale 
Probleme formal und auch in der technischen Durchfuhrung weitgehend identisch. 
Dies ermoglicht die zeit- und kostensparende Implementierung von Losern fur 
verschiedenste Anwendungen basierend auf einheitlichen Programmstrukturen. Die 
Verwendung von B-Splines entspricht dem industriellen Standard bei der 
Modellierung geometrischer Objekte und schafft damit eine naturliche Verbindung 
zwischen FE- und CAD/CAM- Anwendungen. Bestehende umfangreiche 
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Programmbibliotheken aus beiden Bereichen konnen zur Implementierung einer 
auf dem erfindungsgemaflen Verfahren beruhender FE-Simulation eingesetzt 
werden. Die nach dem WEB- Verfahren konstruierten Basisfunktionen besitzen alle 
Standardeigenschaften Finiter Elemente. Hierzu gehort insbesondere die Stabilitat 
5 der Basis. Diese bewirkt, dass beispielsweise bei linearen elliptischen 

Randwertproblemen die Konditionszahl des entstehenden Gleichungssystems bei 
kleiner werdender Gitterweite nicht schneller anwachst als bei optimalen 
Triangulierungen. Fur die Anwendungen bedeutet dies beispielsweise, dass sich 
lineare Gleichungssysteme, wie sie bei der FE-Methode typischerweise entstehen, 

10 mittels iterativer Verfahren effizient losen lassen. Weiterhin ist bei gegebenem 
Grad die Approximationsordnung maximal und die Anzahl der bendtigten 
Parameter minimal. Damit sind sehr genaue Approximationen schon mit relativ 
geringer Parameterzahl moglich. Konkret kann dies bedeuten, dass Genauigkeiten, 
die bislang den Einsatz von Groflrechnern erforderten, auf Arbeitsplatzrechnern 

15 erzielt werden konnen. Die regulare Gitterstruktur der erfindungsgemaften Basis 
ermoglicht eine sehr effiziente Implementierung, insbesondere bei der Aufstellung 
und Losung von FE-Systemen. Ferner gelingt es durch Verwendung der 
Gewichtsfunktion Randbedingungen bei der Simulation einzuhalten, ohne die 
regulare Gitterstruktur der Basisfunktionen zu beeintrachtigen. Schliefilich kann 

20 bei der Losung linearer elliptischer Randwertprobleme durch den Einsatz von 
Mehrgitter- Verfahren zur Losung des entstehenden linearen Gleichungssystems 
erreicht werden, dass die Gesamtlosungszeit proportional zur Anzahl der gesuchten 
Koefhzienten und damit optimal ist. 

25 Das erfindungsgemafie Verfahren in der speziellen bevorzugten Ausfuhrungsart 

(WEB-Verfahren) wird anhand des in Fig. 5 gezeigten ersten Ausfiihrungsbeispiels 
veranschaulicht. Die Differenzialgleichung und Randbedingungen sind sehr 
elementar gewahlt, so dass ohne grofien Mehraufwand neben der 
erfindungsgemafien Konstruktion der WEB-Basis der gesamte Ablauf der 

30 F El- Simulation verfolgt werden kann. 



In der oberen Bildhalfte ist eine elastische Membran gegeben, die entlang dem 
Rand P eines ebenen Simulationsgebietes H fixiert ist und auf die im Inneren des 
Gebietes ein konstanter Druck f = I wirkt. Die Verschiebung u erfiillt bei 
geeigneter Normierung die Poisson-Gleichung mit homogenen Randbedingungen, 

~Au = 1 in Q 
u = 0 auf T. 

Die Verschiebung u bzw. Auslenkung der Membran ist in der unteren Bildhalfte 
der Fig. 5 ersichtlich. Wie oben beschrieben, gliedert sich das WEB-Verfahren in 
die folgenden Schritte. 

Eingabe 1 des Simulationsgebietes Q: Der Rand T ist eine periodische Spline-Kurve 
vom Grad 6, die durch ihre Kontrollpunkte 20 (in Fig. 5 mit schwarzen Punkten 
gekennzeichnet) gespeichert wird. 

Eingabe 2 der Randbedingungen: Die homogene Randbedingung ist wesentlich, so 
dass die Konstruktion einer Gewichtsfunktion erforderlich ist. 

Eingabe 3 der Steuerparameter: Es wird der Grad n = 2 und, um die Figuren 
ubersichtlich zu gestalten, eine relativ grofSe Gitterweite h = 1/3 verwendet. 

Bestimmung 4 der Zelltypen: Wie in Fig. 6 illustriert, wird das Simulationsgebiet 
durch ein Gitter 21 iiberdeckt, das die Gitterzellen der Trager aller potenziell fur 
die Basiskonstruktion relevanten B-Splines enthalt. Die Typbestimmung ergibt in 
dem Beispiel 69 aufiere Gitterzellen 22 und 11 innere Gitterzellen 24, sowie 20 
Gitterzellen 23 auf dem Rand.. 

Klassifikation 5 der B-Splines: Der Trager des B-Splines b k ist hier das Quadrat Q k 
mit den Ecken 



{k u k 2 )h, (fci+3,fc 2 ), (&i +3,fc 2 +3)/i, (k u k 2 + Z)h\ 
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<5(_ 4 ,o) und 0(2,i) sind in Fig. 8 gezeigt. Die Gitterpunkte kh der relevanten 
B-Splines, fur die Qk das Innere des Simulationsgebietes schneidet, sind in Fig. 8 
durch einen Punkt oder einen Kreis markiert. Alle Gitterpunkte ih fur innere 
B-Splines (i aus der Indexliste /), fur die mindestens eine Zelle des Tragers Qi 
5 vollstandig im Inneren von Q liegt, sind durch einen Punkt markiert. 

Beispielsweise liegt fur i = (-4,0) die Gitterzelle (-2,Q)k + [0, h] 2 ganz in H. Alle 
Gitterpunkte jh fur aufiere B-Splines (j aus der Indexliste J), fur die keine Zelle 
des Tragers Qj ganz in Q liegt, sind durch einen Kreis markiert. 

10 Berechnung 6 der Kopplungskoeffizienten: Zur Bestimmung der 

Kopplungskoeffizienten e, j wird fur jedes feste j der Indexliste J der 
nachstgelegene 3 x 3-Bereich 

= {tiX + 1, h + 2} x {i 2 J 2 + l,£ 2 + 2} 

von Indizes in / gesucht. In Fig. 10 ist fur den mit einern Kreis markierten auCeren 
15 Gitterpunkt j = ( — 1,2) der Bereich durch Punkte gekennzeichnet. Die 
Figur 10 zeigt ebenfalls die zugehorigen Kopplungskoeffizienten in 
Matrixdarstellung. Sie werden mit bivariater Interpolation berechnet. 
Beispielsweise ist das Interpolationspolynom zu i = ( — 1,-1) 

Pi(x) = —xfai -f 2)x 2 (x 2 - l)/2. 

20 Sein Wert an der Stelle x = j = (-1, 2) ist Pi {j) = 1 = e id . Es fallt auf, dass viele 
der Kopplungskoeffizienten 0 sind. Dies ist ein typisches Phanomen. Die 
Kopplungskoeffizienten e it j sind nur dann fur alle i der Indexliste ungleich 0, 
wenn die Indizes i in jeder Komponente von dem Index j verschieden sind. 

25 Berechnungsvorschrift 7 fur die Gewichtsfunktion: Die Gewichtsfunktion ist durch 
die Gleichung (3) gegeben mit n = 2 und 5 — 0.2. Der Parameter 5 wird numerisch 
berechnet. Er muss klein genug sein, so dass Singular itaten der Abstandsfunktion 
vermieden werden. Zur Berechnung der Abstandsfunktion erstellt das Verfahreii 
ein Programm, das mit Hilfe des Newton- Verfahrens arbeitet. Da die 
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Gewichtsfunktion nur in einem Randstreifen ungleich 1 ist, ist der Aufwand bei der 
spateren Auswertung gering. 

Ausgabe: Fig. 13 zeigt den Trager eines WEB-Splines Bi und die zu seiner 
5 Beschreibung benotigten Daten. Dies sind die Indexliste J(i) der mit 6,- 
gekoppelten aufieren B-Splines bj y die Kopplungskoeffizienten aj und der 
Gewichtspunkt a:,-. Diese Daten werden unter Einbeziehung der Gewichtsfunktion 
zur Erstellung einer Berechnungsvorschrift fiir die WEB-Splines benutzt. 

10 Der weitere Ablauf der FE-Simulation folgt dem Stand der Technik. 

Aufstellen 9 des FE-Systems: Die Eintrage der Systemmatrix und der rechten Seite 
sind 



15 Das Gleichungssystem GC = F fiir die Basiskoeffizienten C* t - hat im betrachteten 
Beispiel die Dimension 31. Die Matrixeintrage Gk,i werden mit Hilfe von 



Losen 10 des FE-Systems: Das Galerkin-System wird iterativ mit dem Verfahren 
20 der konjugierten Gradienten gelost, wobei die SSOR-Vorkonditionierung zur 

Konvergenzbeschleunigung Verwendung flndet. Nach 24 Iterationsschritten wird 
die Losung im Rahmen der Rechnergenauigkeit gefunden (Toleranz < le — 14). 

Berechnung 11 und Ausgabe 12 der Approximation: Die mit dem 
25 erfindungsgemaCen Verfahren berechnete Approximation ist u = J2i und wird 
in in der unteren Bildhalfte von Fig. 5 grafisch dargestellt. Der relative Fehler in 
der L 2 -Norm betragt 0.028. 




numerischer Integration berechnet, ebenso die Integrale Fjt. 



30 



Die Leistungsfahigkeit des erfindungsgemaCen Verfahrens in der speziellen 
bevorzugten Ausfiihrungsart (WEB- Verfahren) wird in einem zweiten 
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Ausfiihrungsbeispiel anhand der Simulation einer inkompressiblen Stromung 
veranschaulicht. Die in Fig. 14 gezeigte Anordnung zweier kreisformiger 
Hindernisse in einem parallel berandeten Kanal dient der Illustration des 
prinzipiellen Vorgehens. Bei komplizierteren Geometrien, wie sie in konkreten 
5 Anwendungen typischerweise vorliegen, arbeitet das Verfahren vollkommen analog 
und effizient. In Fig. 14 sind die Stromungslinien 25 innerhalb des durch Ti bis T 4 
sowie durch T 5 und T 6 berandeten Gebiets dargestellt. Die DifTerenzialgleichung ist 



Au ~ 0 in 



mit den Randbedingungen 



du du du 

10 q~ - Vq auf Pi , — = -v Q auf T 2 , — = 0 auf T 3 , . . . , T 6 . 

on On on 

Die Flussgeschwindigkeit v = — grad u ist in der unteren Bildhalfte dargestellt. 

Die erfindungsgernafSe Konstruktion der WEB-Basis lauft vollkommen analog zu 
dem ersten Ausfiihrungsbeispiel ab. Der einzige Unterschied ist, dass aufgrund der 
15 natiirlichen Randbedingungen keine Gewichtsfunktion erforderlich ist. 

Fig. 15a bis Fig. 15c zeigen die Klassifikation der relevanten B-Splines fur 
verschiedene Grade n (s. auch Fig. 8). In der Abbildung sind die inneren B-Splines 
6 t -, die in die WEB-Basis ohne Erweiterung iibernommen werden, durch schwarze 
20 Dreiecke markiert. Fiir kleines h nimmt die Anzahl dieser B-Splines zu, d.h., es gilt 
Bi — bi fiir den iiberwiegenden Teil der WEB-Basis. Im betrachteten Beispiel trifft 
dies bei Grad n = 3 fiir 236 von 252 Indizes i zu. 



Fig. 16a zeigt in zwei Diagrammen den numerisch bestimmten relativen L 2 -Fehler 
25 des Potenzials (linke Bildhalfte) in Abhangigkeit von der Gitterweite h — 2~ k mit 
k = 1, . . . ,5 und die numerisch geschatzte Konvergenzordnung m (rechte 
Bildhalfte). Dabei werden fiir die verschiedenen Grade der WEB- Splines als 
Kennzeichner * (n = 1), o (n — 2), A (n = 3), □ (n = 4) und * (n = 5) verwendet. 
Erwartungsgemafi ergibt sich m « n + 1, d.h. eine ungefahre Fehlerreduktion um 
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den Faktor 2 n+1 bei Halbierung der Gitterweite. Analog ergibt sich fur den in der 
Fig. 16b abgebildeten relativen Approximationsfehler der Flussgeschwindigkeit 
(Z^-Norm der Losung, linke Bildhalfte) eine Konvergenzordnung von m n 
(rechte Bildhalfte) und die damit verbundene Fehlerreduktion um etwa den Faktor 
5 2" bei Halbierung der Gitterweite. 

Fig. 16c (rechte Bildhalfte) zeigt die Rechenzeit in Sekunden fur die Konstruktion 
der WEB-Basis in Abhangigkeit von der Zahl der resultierenden Basisfunktionen 
gemessen auf einem Pentium II - Prozessor mit 400 MHz. Beispielsweise werden 

10 fur die Konstruktion einer WEB-Basis vom Grad 3 zur Gitterweite h — 0.125 mit 
2726 WEB-Splines 1.32 Sekunden benotigt. Es fallt auf, dass der Aufwand zum 
Erstellen der WEB-Basis weitgehend unabhangig vom Grad n der Basis ist. In der 
linken Bildhalfte der Fig. 16c ist die Anzahl der CG-Iterationen bezogen auf die 
Anzahl der Basisfunktionen gezeigt. So werden fur das zugehorige System mit 2726 

15 Unbekannten 65 PCG-Iterationen benotigt. Die Gesamtrechenzeit inklusive 
Aufstellen und Losen des Galerkin-System betragt etwa 2.48 Sekunden. 

In Fig. 17 wird die W^EB-Methode mit einem Standardlosungsverfahren, das das 
Simulationsgebiet vernetzt bzw. trianguliert (obere Bildhalfte) und Hutfunktionen 

20 verwendet, verglichen. Die Grafik zeigt in der unteren Bildhalfte den £ 2 -Fehler 

bezogen auf die Anzahl der Parameter. Die Ergebnisse des Standardlosers sind mit 
fetten Karo-Kennzeichnern markiert und werden den mit Hilfe von WEB-Basen 
der Grade 1 bis 5 erzielten Ergebnissen gegenubergestellt. Beispielsweise wird eine 
Genauigkeit von 10~ 2 mit der WEB-Methode durch Verwendung von 213 

25 Basisfunktionen mit Grad 2 erreicht bei. einer Gesamtrechenzeit von 0.6 Sekunden. 
Zum Erzielen der gleichen Genauigkeit benotigt das Standardverfahren mit 
linearen Hutfunktionen 6657 Basisfunktionen. 
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Bei der Beurteilung des Standardlosungsverfahrens sind noch zwei weitere Aspekte 
zu beachten. Zum einen verdeutlicht Fig. 17, dass selbst eine moderate 
Genauigkeit von 10~ 3 mittels Hutfunktionen nur erreichbar ist, wenn weit mehr als 
eine Million Koeffizienten verwendet werden. Dies zeigt, dass genaue Resultate bei 
5 der Verwendung von Hutfunktionen in der Regel eine enorme Rechen- und 
Speicherkapazitat erfordern oder aber nach dem Stand der Technik gar nicht 
erreichbar sind. Zum anderen steigt der zur Vernetzung erforderliche Aufwand mit 
der -Komplexitat des Simulationsgebietes. Im Gegensatz-zu realistischen 
Anwendungen ist das hier untersuchte Gebiet aufgrund seiner sehr einfachen 
10 Struktur noch vergleichsweise einfach zu triangulieren. 

Das zweidimensionale Beispiel zeigt den Performancegewinn durch das 
WEB-Verfahren. Eine noch grofiere Leistungssteigerung ist bei dreidimensionalen 
Problemen moglich. Zum einen ist dort der Aufwand fur die Vernetzung, die bei 
15 dem WEB-Verfahren entfallt, wesentlich grofier. Zum anderen macht sich hier auch 
die Reduktion der Anzahl der benotigten Basisfunktionen noch wesentlich 
deutlicher bemerkbar als im zweidimensionalen Fall. 

Die Fig. 18 zeigt eine erfindungsgemafle Vorrichtung, insbesondere eine 
20 Computereinrichtung 30, mit Eingabemitteln 31, 32, 33, Ausgabemitteln 34 sowie 
eine den Verfahrensablauf steuernde Steuereinrichtung 35. Zur Abarbeitung des 
erfindungsgemaflen Verfahrens und insbesondere zum Zwecke der Parallelisierung 
des zugehorigen Rechenablaufs bedient sich die zentrale Steuereinrichtung 35 
vorzugsweise mehrerer arithmetischer logischer Einheiten (Arithmetic Logical 
25 Unit, ALU) oder sogar mehrerer zentraler Verarbeitungseinheiten (Central 

Processing Unit, CPU) 36. Diese erlauben insbesondere eine parallele Abarbeitung 
der Verfahrensschritte Klassifizieren 5 der B-Splines, insbesondere auch Schneiden 
des regularen Gitters mit dem Simulationsgebiet ft, Ermitteln 6 der 
Kopplungskoffizienten e ( j und/oder Auswerten der Gewichtsfunktion w(x) an 
30 Punkten x des Simulationsgebietes ft. 
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Die Recheneinheiten 36 greifen dabei auf den gemeinsamen Datenbestand von 
Speichermitteln 37 zu. Die Eingabe der Daten kann beispielsweise mittels einer 
Tastatur 31, einem maschinenlesbaren Datentrager 38 iiber eine zugehorige 
Lesestation 32 und/oder iiber ein drahtgebundenes oder drahtloses Datennetz mit 
5 einer Empfangerstation 33 erfolgen. Uber die Lesestation 32 bzw. einen zugehorigen 
Datentrager 38 kann auch das den Verfahrensablauf steuernde Steuerprogramm 
eingegeben werden und beispielsweise auf dem Speichermittel 37 dauerhaft 
abgelegt werden. Entsprechend kann das Ausgabemittel 34 einen Drucker, einen 
Monitor, eine Schreibstation fur einen maschinenlesbaren Datentrager und/oder 
10 eine Sendestation eines drahtgebundenen oder drahtlosen Datennetzes aufweisen. 
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Patentanspriiche 

1. Verfahren zur Erhohung der Leistungsfahigkeit einer Computereinrichtung 
zur Finiten-Elemente-Simulation durch automatische Generierung geeigneter 
Basisfunktionen mit Hilfe von B-Splines mit dea folgenden Schritten: 

5 • Definieren (1) eines Sirnulationsgebietes (Q) und Abspeichern von 

Gebietsdaten des Sirnulationsgebietes (O), 

• Eingabe (2) und Abspeichern von Randbedingungen, 

• Festlegen (3) einer vorgebbaren Gitterweite h und eines vorgebbaren 
Grades n der B-Splines, 

10 • Ermitteln (4) eines sich iiber das Simulationsgebiet (Q) erstreckenden 

Gitters und eines Typs der Gitterzellen, 

• Klassifizieren (5) der B-Splines, deren Trager das Simulationsgebiet 
schneiden, durch. Ermitteln von inneren und aufteren B-Splines, wobei 
fur auflere B-Splines der Schnitt des Tragers mit dem Simulationsgebiet 

15 (fi) kleiner als eine vorgebbare Schranke s ist, 

• Ermitteln (6) von Kopplungskoefnzienten aj zur Bildung von 
Linearkombinationen von inneren und aufieren B-Splines, 

• Speicherung und Ausgabe der die Basisfunktionen bestimmenden 
Parameter. 

20 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass vor dem Speichern 
und Ausgeben der Parameter der Schritt durchgefuhrt wird: 
Festlegen (7) einer vorgebbaren Gewichtsfunktion w sowie Bestimmen (8) 
von Gewichtspunkten und Skalierungsfaktoren. 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die 
25 Gewichtsfunktion w durch einen glatten Ubergang von einem konstanten 

Plateau im Inneren des Sirnulationsgebietes (ft) zum Wert Null auf dem 
Rand (P) festgelegt wird. 
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4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, dass 
B-Splines mit mindestens einer ganz im Simulationsgebiet (ft) enthaltenen 
Gitterzelle des Tragers als innere B-Splines klassifiziert werden. 

5. Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, dass 
5 der Gewichtspunkt als Mittelpunkt einer ganz im Simulationsgebiet (Cl) 

enthaltenen Gitterzelle des Tragers des entsprechenden inneren B-Splines 
gewahlt wird. 

6. Verfahren nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, dass 
das Simulationsgebiet (H) durch Einspeichern von aus einer 

10 computergestutzten Konstruktion (CAD/CAM) ableitbaren Daten deflniert 

wird. 

7. Verfahren nach einem der Anspruche 1 bis 6, dadurch gekennzeichnet, dass 
die Gitterweite h unter Verwendung von abgespeicherten empirisch und/oder 
analytisch gewonnenen Werten mittels einer zugehorigen ersten 

15 Bewertungsfunktion automatisch festgelegt wird. 

8. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, dass 
der Grad n unter Verwendung von abgespeicherten empirisch und/oder 
analytisch gewonnenen Werten mittels einer zugehorigen zweiten 
Bewertungsfunktion automatisch festgelegt wird. 

20 9. Verfahren nach einem der Anspruche 1 bis 8, gekennzeichnet durch die 
Schritte: 

• Aufstellen (9) eines bei der FE-Simulation zu losenden 
Gleichungssystems , 

• Losen (10) des Gleichungssystems, 

25 • Berechnen (11) einer Naherungslosung, und 

• Ausgeben (12) der Naherungslosung. 



10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass beim Losen (10) 
des Gleichungssystems ein Mehrgitter- Verfahren eingesetzt wird. 

11. Vorrichtung zur Durchfiihrung eines Verfahrens nach einem der Anspriiche 1 
bis 10, insbesondere Computereinrichtung, mit Eingabemitteln (31, 32, 33) 
und Ausgabemitteln (34), Speichermitteln (37) und einer Recheneinheit (35, 
36), dadurch gekennzeichnet, dass die regulare Gitterstruktur zur 
Optimierung des Rechenablaufs, insbesondere durch Parallelisierung, 
ausgenutzt wird. 

12. Maschinenlesbarer Datentrager (38), insbesondere Magnetband, 
Magnetscheibe, Compact Disc (CD) oder Digital Versatile Disc (DVD), 
dadurch gekennzeichnet, dass auf dem Datentrager (38) ein Steuerprogramm 
fur eine Computereinrichtung (30) gespeichert ist, gemaft dem durch die 
Computereinrichtung (30) ein Verfahren nach einem der Anspriiche 1 bis 10 
abgearbeitet werden kann. 
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Zusammenfassung 



Die Erfindung betrifTt ein Verfahren zur Erhdhung der Leistungsfahigkeit einer 
Computereinrichtung bei Finite- Elemente-Sirnulationen durch effiziente 
automatische Konstruktion geeigneter Basisfunktionen fur die Berechnung von 
Naherungslosungen, und eine solche Computereinrichtung. Bei dem 
erfmdungsgemaflen Verfahren wird ein das Simulationsgebiet fl iiberdeckendes 
Gitter erstellt. Darauf definierte B-Splines, deren Trager das Simulationsgebiet 
schnei den, werden in innere und aufiere B-Splines klassifiziert (5). Anschliefiend 
werden Kopplungskoeffizienten zur Bildung von Linearkombinationen von inneren 
und aufieren B-Splines errnittelt (6) und die die resultierenden Basisfunktionen 
bestimmenden Parameter gespeichert und ausgegeben. 
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Stuttgart, May 11, 2000 

University of Stuttgart 
Keplerstrasse 7, D-70174 Stuttgart 

Process for Increasing the Efficiency 
of a Computer System in Finite Element Simulations 
and such a Computer System 

The invention relates to a process for increasing the efficiency of a computer 
system in finite element simulations by efficient automatic construction of suitable 
basis functions for computation of approximate solutions, and to a computer 
system for performing that process. 

5 

A plurality of technical and physical phenomena can be described by partial 
differential equations. They include among others problems from fluid mechanics 
(for example, flow around an airfoil), electromagnetic field theory (for example, 
electrical field behavior in a transistor) or elasticity theory (for example, 

10 deformation of a car body). Accurate knowledge and description of such processes 
are a central element in the construction and optimization of technical objects. To 
save time-consuming and cost-intensive experiments, there is great interest in 
computer-aided simulations. Finite element processes (FE processes) have become 
established and have been the topic of intensive research for a . long time. This 

15 applies especially also to automatic mesh generation processes as a foundation for 
construction of suitable basis functions. 

Figure 1 illustrates in the left half the prior art in the process of FE simulation for 
a linear boundary value problem as a typical model example. Proceeding from the 
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data describing the geometry of the technical object to be simulated, first a system 
of basis functions is constructed which on the one hand enables fulfilment of 
boundary conditions and on the other is suited for approximation of the unknown 
solution. Then, using these basis functions a system of linear equations is set up 
5 by numerical integration methods. Finally, the coefficients of the unknown 
approximation are determined as the solution of this system of linear equations. 

FE methods or their use are the subject matter of a series of patents. For example, 
see US 4, 819, 161 where FE approximations of a large class of differential equation 
10 are automated, and US 5, 731, 817 where a process for generation of hexahedral 
meshes forms the foundation for a FE simulation process. 

In most FE processes of practical relevance basis functions are used which are 
defined on a decomposition produced by generating a mesh of the simulation 

15 region. Figure 2a shows a selection of conventional elements; their dimension, 
degree, smoothness and parameters are listed in Figure 2b. A survey of meshing 
methods of planar regions can be found for example in K. Ho-Le, Finite Element 
Mesh Generation Methods: A review and classification. Comp. Aided Design 20 
(1988), 27 — 38. Generating a mesh for complicated three-dimensional regions is 

20 extremely difficult using the current state of knowledge, as shown by S. Owen, A 
survey of unstructured Mesh Generation Technology, Proceedings, 7th 
International Meshing Round Table, Sandia National Lab (1998), 239 - 257. The 
processes require extensive amounts of computing time and are to some extent not 
yet completely automated. But recently, there has been a series of very innovative 

25 new approaches. For example, A. Fuchs, Optimierte Delaunay-Triangulierungen 
zur Vernetzung getrimmter NURBS-Korper, University of Stuttgart, 1999, 
simulates a force distribution in order to achieve an optimum distribution of 
triangulation points. In US 5, 729, 670 two- and three-dimensional meshes are 
produced by solving flow problems; this is an interesting reversal of the 

30 conventional FE mechanism. In addition, many algorithms have been developed to 
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improve individual component aspects of mesh generation processes. For example 
DE 196 21 434 Al and US 5, 774, 696 describe a process for elimination of 
intersections with prescribed edges or boundary surfaces in Delaunay 
triangulations. 

5 

Meshless FE-methods to date have not acquired any importance for applications. 
Both in the Lagrange multiplier method, see for example J.H. Bramble, The 
Lagrange Multiplier Method for Dirichlet's Problem, Math. Comp. 
37(1981), 1 — 11, and also in the penalty method, see for example P. Bochev and 
10 M. Gunzburger, Finite Element Methods of Least Squares Type, SI AM review 
40 (1998), 789 - 837, the treatment of boundary conditions represents a major 
problem in the use of simple, stable basis functions. 

In many technical simulations, automatic mesh generation is very complex and 
15 requires by far the largest part of the computer time. Furthermore, the 
approximation power of the conventionally used linear and multilinear basis 
functions is low. To achieve accurate results, a large number of basis functions 
must be used, and thus, a correspondingly large system of equations must be 
solved. Higher order trial functions on triangulations generally likewise have an 
20 unfavorable ratio between the attainable accuracy and the number of basis 
functions used. Finally, smooth basis functions cannot be easily defined on 
unstructured meshes. Very special constructions are necessary already for 
continuously differentiable elements (see Figure 2a). 

25 The object of the invention is to increase the efficiency of known FE methods and 
computer systems which carry out FE methods by efficient construction of basis 
functions with favorable properties. In particular the meshing of the simulation 
region will be completely eliminated, optional boundary conditions are fulfiled, 
accurate solutions are obtained with relatively few coefficients, and the resulting 

30 system of equations will be solvable efficiently. In this way the disadvantages of 
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the prior art will be overcome, and thus, the accuracy and speed of the simulation 
of physical properties in the engineering and optimization of technical objects will 
be improved. 

5 Some central terms and notations which are used in the following description of 
the process as claimed in the invention will be explained first. 

The simulation region f2 is a bounded set of dimension d = 2 or d = 3 on which the 
physical quantities to be studied will be approximated by means of FE methods. 
10 The boundary of the simulation region is denoted by V. A grid with grid width h 
is defined as a decomposition of a subset of the plane or the space in grid cells Z*. 
Depending on the dimension d each grid cell is a square or a cube with edge length 

h. More precisely, Z k = kh+ [0, h] d , where h belongs to a set of integer d-vectors. 
The uniform tensor product B-splines in d variables of degree n with grid width h 

15 are denoted by b k: see for example C. de Boor, A Practical Guide to Splines, 

Springer, 1978. They are functions which can be continuously differentiated (n — 1) 
times and which on the grid cells agree with polynomials of degree n, as shown in 
Figures 4a and 4b. Figure 4a shows a support Q k of the B-spline of degree n = 2, 
dimension d = 2 and smoothness m — 1. In Figure 4b, the resulting tensor product 

20 B-spline 6 fc is shown. The support Q fc , i.e. the union of all grid cells, on which the 
B-spline b k is not identically zero, consists of (n + l) d grid cells; more precisely, 
Qk — kh-^- [0, (n + l)h] d . In all figures, the B-spline b k is marked at the point kh, 

i. e. for example in the case d = 2 at the lower left corner of the support. For FE 
simulations only those B-splines are important which have support intersecting the 

25 simulation region fi; they are called relevant B-splines. The relevant B-splines are 
again divided into two groups; those B-splines for which the part of the support 
inside the simulation region is larger than a prescribed bound s are called inner 
B-splines. All other relevant B-splines are called outer B-splines. 



30 



The object of this invention is achieved by the process defined in claim 1. Special 
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embodiments of the invention are defined in the dependent claims. Claim 11 
defines a computer system as claimed in the invention. 

The right half of Figure 1 shows the incorporation of the process as claimed in the 
5 invention into the course of a FE simulation in the prior art and the substitution 
of certain process steps of a FE simulation in the prior art by the process of the 
present invention. 

Input 1 of the simulation region Q, can be done via input devices, in particular also 
10 by storage of data derived from computer-aided engineering (CAD/CAM). For 
example, the data used in the engineering of a motor vehicle can be incorporated 
directly into the FE simulation as claimed in the invention. 

In input 2 and storage of the type of boundary conditions natural and essential 
15 boundary conditions are distinguished. The basis as claimed in the invention is 
constructed for homogeneous boundary conditions of the same type. In particular, 
for essential boundary conditions, the basis functions vanish on the boundary T. 
Inhomogeneous boundary conditions can be treated in the assembly of the FE 
systems using methods which correspond to the prior art. 

20 

Finally, the control parameters are read in 3. They relate to the degree n and the 
grid width h of the B-splines to be used and the bound s for classification of the 
inner and outer B-splines. If specifications are omitted, all these input parameters 
can be automatically determined by evaluation of merit functions which are 
25 constructed empirically or analytically. 

The following construction of the basis functions as claimed in the invention is 
divided into the steps shown schematically in Figure 3, which will now be 
described. 
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After reading in the simulation region Q, in the first process step a grid covering 
the simulation region fi is generated. Then it is checked which of the grid cells lie 
entirely inside, partially inside or not inside the simulation region H. The cell 
types 4 are determined, and this information about the cell types is stored. This 
5 essentially requires inside/outside tests and determinations of intersections 
between the boundary V of the simulation region Q and the segments or squares 
which bound the grid cells. Figure 7 shows the input and output data for this 
process step. 

10 In the second process step, using the information about the cell types, the relevant 
B-splines are first determined. Then the classification 5 into outer B-splines is 
performed; the corresponding lists of indices are denoted by / and J. To this end, 
the size of those parts of the supports of the B-splines which lie within the 
simulation region is determined using the data obtained in the first process step, 

15 and compared with the prescribed bound s. Figure 9 shows the input and output 
data for this process step. 

In the third process step, coupling coefficients are computed 6; they join the 
inner and outer B-splines according to the rule 



Hence, an extended B-spline Bj is assigned to each inner B-spline 6*. The 
construction and the properties of the index sets J{i) and the coupling coefficients 
e it j are given as follows. The index sets J(i) consist of indices of outer B-splines. 
They correspond to complementary index sets of indices of inner B-splines; 
25 i.e., i belongs to if and only if j belongs to J(i). For a given outer index j the 
index set is an array, i.e., a quadratic or cubical arrangement of (n+ l) d inner 
indices which is characterized by a minimum distance to the index j. For a given 
outer index j and an inner index i in the index set let pi be the d-variate 
polynomial of degree n in each variable which has the value 1 at the point % and at 
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all other points of the array the value 0. Then the coupling coefficient is 
given as the value of pi at the point j, i.e., e i}j — pi{j). The specific values of the 
coupling coefficient can either be tabulated for different degrees and relative 
positions of j and or can be easily computed using Lagrange polynomials. 
5 Figure 11 shows the input and output data for this process step. 

If natural boundary conditions are given, the extended splines defined in equation 
(1) are used without modification for further implementation of the FE process. If 
conversely essential boundary conditions are given, a weighting according to the 
10 rule 

Bi(x) <- ^W), i€l (2) 
w(Xi) 

has to be performed. The pertinent interrogation takes place in an optional process 
step 6a. The functions defined in this way are called weighted extended B-splines 
(WEB-splines). Formally, the extended' B-splines used under natural boundary 

15 conditions correspond to the special case w(x) = 1. They are, therefore, also called 
WEB-splines. For the case of essential boundary conditions, the weight function w 
is characterized as follows: For all points x of the simulation region, w(x) can be 
bounded from above and below by positive constants, which are independent of z, 
times the distance dist(x) of the point x from the boundary T. In other words, w 

20 is positive within Q, and tends to zero in the vicinity of the boundary T as fast as 
the distance function dist. For simulation regions which are bounded by 
elementary geometrical objects (circles, planes, ellipses, etc.) a suitable weight 
function can optionally be given in explicit analytic form. Otherwise, computation 
rules should be used which typically represent a smoothing of the distance 

25 function. The scaling factor l/w(xi) is calculated by evaluating the weight 
function at the weight point X;. This can be any point in the support of the 
B-spline bi which is at least half the bound s/2 away from the boundary. 



As a result of the process as claimed in the invention, a computation rule for the 
30 WEB-splines B,- (compare definitions (1) and (2)) is obtained which have all 
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favorable properties according to the object of the invention. Thus the FE method 
can be continued according to the prior art. But, in doing so, it is possible to 
advantageously exploit the regular grid structure of the basis functions according 
to claim 11. 

5 

In summary, it can be stated that for the process as claimed in the invention the 
coupling of the outer to the inner B-splines is, among other things, important. As 
a result, the constructed basis has the properties which are essential for FE 
computations. In particular, a basis (i from the index set J) according to the 
10 present invention, is uniformly stable with respect to the grid width h, and the 
error has the same order as for the B-splines in the approximation of smooth 
functions which satisfy the same boundary conditions. On the other hand, the 
fulfilment of essential boundary conditions is ensured by using the weight function 
w. 

15 

The above described process steps and their properties as well as the preferred 
execution and the pertinent embodiments will be further explained and illustrated 
using the figures listed below. The features mentioned in the claims and in the 
specification can be essential to the invention individually or in any combination. 

20 Figure 1 shows in the prior art the individual steps in the course of the 
finite element simulation and fits the determination of the WEB 
base into this course, 
Figure 2a compares certain finite elements of the prior art to the WEB 
element shown in Figure 2b and lists the parameters relevant to 
25 finite element approximations, 

Figure 3 shows in a flow chart the process steps for determining the WEB 
basis, 

Figures 4a and 4b show a support and the corresponding tensor product 
B-spline of degree 2, 



Figures 5a and 5b illustrates the problem formulation of the first 
embodiment (displacement of a membrane under constant 
pressure) and shows the corresponding solution, 

Figure 6 shows the cell types for the first embodiment, 

Figure 7 surveys the input and output data of the process for determining 
the cell types, 

Figure 8 illustrates, by way of example, the classification of the B-splines 
for the first embodiment, 

Figure 9 outlines the input and output data of the process for classifying 
the B-splines, 

Figure 10 shows the coupling coefficients of an outer B-spline and the 
corresponding inner B-splines for the first embodiment, 

Figure 11 surveys the input and output data of the process for computing 
the coupling coefficients, 

Figures 12a and 12b illustrate the construction of the weight function of 
the preferred embodiment, 

Figure 13 shows the support of a WEB-spline and the corresponding 
coupling coefficients for the first embodiment, 

Figures 14a and 14b explain the problem formulation of a second 

embodiment (incompressible flow) and its solution using the flow 
lines and a figure for the distribution of the flow velocity, 

Figures 15a to 15c show the changing classification of B-splines for the 

B-spline degrees n = 1, 2, 3 and the same grid width for the second 
embodiment, 

Figures 16a to 16c provide information about the error development in the 
finite element approximation using WEB-splines and about the 
computing time behavior of the WEB approximations for the 
second embodiment, 
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Figures 17a and 17b compare the WEB basis to a process based on linear 

trial functions on a triangulation (prior art), and 
Figure 18 shows a computer system as claimed in the invention. 

One especially favorable embodiment of the process as claimed in the invention, 
5 called the WEB process, is determined by the following specifications. 

The bound s is chosen such that the inner B-splines are characterized by requiring 
that at least one of the grid cells of their support lies completely in the simulation 
region Q. Since to determine the relevant B-splines, the intersection of the grid 
10 cells and the boundary T must be computed anyway, the classification requires no 
significant additional computing time. The weight point X{ is chosen as the 
midpoint of a grid cell in the support of the B-spline 6,- which lies completely in 
the simulation region f2. This is also efficiently possible since the determination of 
one such cell is already part of the classification routine. 



15 



If no explicit analytic form of the weight function is known, it is defined by 

t 

1 if dist(z) > £ 



w(x) = 



(3) 

1 - (1 - dist(x)/5) n if dist(a;) < 6. 



Figures 12a and 12b illustrate the construction of the weight function. Here, the 
parameter 5 indicates the width of the strip Q$ within which the weight function 
20 varies between the value 0 on the boundary of the simulation region and the value 
1 on the plateau on fi\$V The parameter 5 is chosen such that the smoothness of 
the weight function is ensured. 

One important advantage of the process is that no meshing of the simulation 
25 region is necessary. In technical applications, this results in clear savings of 

computing time and storage capacity and simplifies the course of the simulation. 
The process structure for two- and three-dimensional problems is formally and 
technically largely identical. This enables time- and cost-saving implementations of 
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solvers for diverse applications based on uniform program structures. The use of 
B-splines corresponds to the industrial standard in the modeling of geometrical 
objects, and thus forms a natural connection between FE and CAD/CAM 
applications. Extensive existing program libraries from both fields can be used for 
5 implementing a FE simulation based on the process as claimed in the invention. 
The basis functions constructed using the WEB process have all standard 
properties of finite elements. This includes especially the stability of the basis. It 
implies, for example, that for linear elliptic boundary value problems the condition 
number of the resulting system of equations does not grow faster than for optimal 

10 triangulations as the grid width becomes smaller. For applications, this means, for 
example, that linear systems of equations as they typically arise in FE methods 
can be efficiently solved by iterative algorithms. Furthermore, for a given degree, 
the approximation order is maximal and the number of necessary parameters 
minimal. Thus, very accurate approximations are possible with a relatively small 

15 number of parameters. Specifically, this can mean that the accuracies which so far 
required the use of mainframe computers can now be achieved with workstations. 
The regular grid structure of the basis as claimed in the invention permits a very 
efficient implementation, especially for assembling and solving FE systems. 
Moreover, by using the weight function, the boundary conditions can be satisfied 

20 during simulation without affecting the regular grid structure of the basis 

functions. Finally, by using multigrid methods to solve the linear systems arising 
in linear elliptic boundary value problems, one can achieve that the overall solution 
time is proportional to the number of unknown coefficients, and thus optimal. 

25 The process as claimed in the invention in the special preferred embodiment 

(WEB process) is illustrated using the first embodiment shown in Figures 5a and 
5b. The differential equation and boundary conditions are chosen to be very 
elementary so that in addition to the construction of the WEB basis as claimed in 
the invention the entire course of the FE simulation can be followed without major 

30 additional effort. 
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Figure 5a shows an elastic membrane which is fixed along the boundary T of a 
planar simulation region fi, and on which a constant pressure / = 1 acts inside the 
region. With suitable normalization, the displacement u satisfies the Poisson 
• 5 equation with homogeneous boundary conditions, 

—Au = 1 in Q 
u = 0 on T. 

The displacement u or the deflection of the membrane is depicted in Figure 5b. As 
10 described above, the WEB process is divided into the following steps. 

Input 1 of the simulation region Q: The boundary T is a periodic spline curve of 
degree 6, which is stored by its control points 20 (in Figure 5a identified with black 
dots). 

15 

Input 2 of the boundary conditions: the homogeneous boundary condition, is 
essential so that the construction of a weight function is necessary. 

Input 3 of the control parameters: The degree n — 2, and, in order to make the 
20 figures easier to understand, a relatively large grid width h = 1/3 are used. 

Determination 4 of the cell types: As illustrated in Figure 6, the simulation region 
is covered by a grid 21, which contains the grid cells of the supports of all 
B-splines of potential relevance for the basis construction. The type determination 
25 in the example yields 69 outer grid cells 22, and 11 inner grid cells 24, and 20 grid 
cells 23 on the boundary. 

Classification 5 of the B-splines: Here, the support of the B-spline 6* is a square 
Qk with corners 

(k u k 2 )h, (ki + 3, k 2 )h, (fci + 3, k 2 + 3)/i, (k u k 2 + 3)/i; 
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Q(_ 4 ,o) and Q(2,i) are shown in Figure 8. The grid points kh of the relevant 
B-splines, for which Q k intersects the interior of the simulation region, are marked 
in Figure 8 by a point or a circle. All grid points ih for inner B-splines (i from the 
index list /), for which at least one cell of the support Qi lies entirely within S7, are 
5 marked by a point. For example, for i = (—4, 0), the grid cell (—2, 0)/i + [0, h] 2 lies 
entirely in fZ. All grid points jh for outer B-splines (j from the index list J), for 
which no cell of the support Qj lies entirely in Q, are marked by a circle. 

Computation 6 of the coupling coefficients: To determine the coupling coefficients 
10 e, j for each fixed j of the index list J the nearest 3 x 3-array 

= + Mi + 2} x {t 2i £ 2 + M 2 + 2} 

of indices in / is sought. In Figure 10, for the outer grid point j = (—1, 2), which is 
marked with a circle, the array is identified with points. Figure 10 likewise 
shows the corresponding coupling coefficients in a matrix representation. They are 
15 computed by bivariate interpolation. For example, the interpolating polynomial 
for i — (-1, —1) is 

Pi{x) = -xi(xi + 2)x 2 (x 2 - l)/2. 

Its value at the point x = j = (—1, 2) is pi(j) = 1 = e^. One notices that many of 
the coupling coefficients are 0. This is a typical phenomenon. The coupling 
20 coefficients e,j are not equal to 0 for all i of the index list only if the indices i 
are different from the index j in each component. 

Computation rule 7 for the weight function: The weight function is given by 
equation (3) with n = 2 and 6 = 0.2. The parameter 5 is computed numerically. It 
25 must be small enough to avoid singularities of the distance function. To compute 
the distance function, the process generates a program which uses Newton's 
method. Since the weight function is not equal to 1 only in a boundary strip, the 
complexity in the subsequent evaluation is low. 
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Output: Figure 13 shows the support of a WEB-spline Bi and the data necessary 
for its description. These are the index list J(i) of the outer B-splines bj coupled 
with 6j, the coupling coefficients e^-, and the weight point X{. These data are used 
in conjunction with the weight function for generating the computation rule for 
the WEB-splines. 

The further course of the FE simulation follows the prior art. 

Assembly 9 of the FE system: The entries of the system matrix and of the 
right-hand side are 



The system of equations GC = F for the basis coefficients Ci in this example has 
dimension 31. The matrix entries Gk,i are computed using numerical integration, 
likewise the integrals i**. 

Solution 10 of the FE system: The Galerkin system is solved iteratively with the 
conjugate gradient method with SSOR preconditioning used to accelerate 
convergence. After 24 iteration steps the solution is found within machine 
accuracy (tolerance < le — 14). 

Computation 11 and output 12 of the approximation: The approximation 
computed with the process as claimed in the invention is u = YL% an( ^ * s 
shown graphically in Figure 5b. The relative error of the L 2 -norm is 0.028. 

The efficiency of the process as claimed in the invention in the special preferred 
embodiment (WEB process) is illustrated in a second embodiment using the 
simulation of an incompressible flow. The arrangement of two circular obstacles 
shown in Figure 14a in a channel with parallel boundaries serves to illustrate the 
principal strategy. For complicated geometries, as are typically present in specific 
applications, the process works completely analogously and efficiently. In 
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Figure 14a the stream lines 25 are shown within the region bounded by Ti to T± 
and by T 5 and r 6 . The differential equation is: 



Au = 0 in ft 



with the boundary conditions 



du du du 

5 -5- = v o on Ti , — = -vq on T 2 , — = 0 on T 3 , . . . , T 6 . 

an an on 

The flow velocity v = — grad u is shown in Figure 14b. 



The construction of the WEB basis as claimed in the invention proceeds 
completely analogously to the first embodiment. The sole difference is that a 
10 weight function is not necessary because of the natural boundary conditions. 



Figures 15a to 15c show the classification of the relevant B-splines for different 
degrees n (see also Figure 8). In the figure, the inner B-splines which are taken 
into the WEB basis without extension, are marked by solid triangles. For small h 
15 the number of these B-splines increases, i.e., Bi = 6» for most of the WEB basis. 
For degree n = 3 this is the case for 236 of 252 indices i in the example. 



Figure 16a shows in two diagrams the numerically determined relative L 2 -error of 
the potential (left half of the figure) as a function of the grid width h = 2~ k with 

20 k — 1, . . . , 5 and the numerically estimated order of convergence m (right half of 
the figure). Here, for different degrees of the WEB-spline the following markers are 
used: * (n = 1), o (n = 2), a (n = 3), □ (n = 4) and * (n = 5). As expected, 
m « n + 1, i.e., an approximate error reduction by a factor 2 n+1 when the grid 
width is cut in half. Analogously, for the relative approximation error of the flow 

25 velocity shown in Figure 16b {H x -noim of the solution, left half of the figure), an 
order of convergence m^m (right half of figure) is obtained with an associated 
error reduction by roughly a factor 2 n when the grid width is cut in half. 
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Figure 16c (right half of the figure) shows the computing time in seconds for 
construction of the WEB basis as a function of the number of resulting basis 
functions, measured on a Pentium II processor with 400 MHz. For example, for 
construction of a WEB basis of degree 3 with grid width h — 0.125 with 2726 
5 WEB-splines 1.32 seconds are necessary. One notices that the complexity for 
generating the WEB basis is largely independent of the degree n of the basis. In 
the left half of Figure 16c the number of CG-iterations relative to the number of 
basis functions is shown. Thus, for the corresponding system with 2726 unknowns, 
65 P CG-iterations are required. The total computing time including assembling 
10 and solving the Galerkin system is roughly 2.48 seconds. 

Figures 17a and 17b compare the WEB process with a standard solution process 
which meshes or triangulates the simulation region (Fig. 17a) and uses hat 
functions. The graph shows in Fig. 17b the Z^-error relative to the number of 

15 parameters. The results of the standard solver are marked with boldfaced 
diamonds and are compared to the results achieved using the WEB basis of 
degrees 1 to 5. For example, an accuracy of 10 -2 is achieved with the WEB 
process by using 213 basis functions with degree 2 and an overall computer time of 
0.6 seconds. To achieve the same accuracy, the standard method with linear hat 

20 functions required 6657 basis functions. 

In the assessment of the standard solution process two other aspects must be 
considered. On the one hand, Figure 17b illustrates that even a moderate accuracy 
of 10" 3 can only be achieved with hat functions when far more than one million 

25 coefficients are used. This shows that when using hat functions accurate results 
generally require an enormous computing and storage capacity or cannot be 
achieved at all with the prior art. On the other hand, the complexity required for 
meshing increases with the complexity of the simulation region. In contrast to 
realistic applications, the region studied here is comparatively simple to 

30 triangulate due to its simple structure. 
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The two-dimensional example shows the performance gain by the WEB process. 
An even greater increase in performance is possible in three-dimensional problems. 
On the one hand, the complexity for meshing, which is eliminated in the WEB 
5 process, is much greater. On the other hand, the reduction in the number of 
required basis functions becomes much more noticeable than in the 
two-dimensional case. 

Figure 18 shows a device as claimed in the invention, especially a computer system 
10 30, with input devices 31, 32, 33, output devices 34 and a control unit 35 which 
controls the course of the process. To carry out the process as claimed in the 
invention and in particular for purposes of parallelization of the pertinent 
computations, the central control unit 35 preferably uses several arithmetic logic 
units (ALU) or even several central processing units (CPU) 36. These allow 
15 especially parallel processing for the process steps classification 5 of the B-splines, 
in particular also intersection of the regular grid with the simulation region f2, 
determination 6 of the coupling coefficients Cij, and/or evaluation of the weight 
function w(x) at points x of the simulation region Q. 

20 The computer units 36 here access the common data resources of the storage units 
37. The data can be input, for example, by a keyboard 31, a machine-readable 
data medium 38 via a corresponding read station 32 and/or via a wire based or 
wireless data network with a receiver station 33. Via the read station 32 or a 
pertinent data medium 38, the control program, which controls the process 

25 execution, can be input, and, for example, can be permanently filed on the storage 
media 37. Accordingly, the output devices 34 can be a printer, a monitor, a write 
station for a machine-readable data medium and/or the transmitting station of a 
wire based or wireless data network. 



Claims 



A process for increasing the efficiency of a computer system for finite element 
simulations by automatic generation of suitable basis functions using 
B-splines, with the following steps: 

• definition (1) of a simulation region (ft) and storage of the data of the 
simulation region (H), 

• input (2) and storage of boundary conditions, 

• establishment (3) of a predefinable grid width h and a predefinable 
degree n of the B-splines, 

• determination (4) of a grid covering the simulation region (Q) and the 
type of the grid cells, 

• classification (5) of the B-splines with support intersecting the 
simulation region (Q) by determining inner and outer B-splines, where 
for outer B-splines the intersection of the support with the simulation 
region (Q) is less than a predefinable bound s, 

• determination (6) of coupling coefficients e^j for formation of linear 
combinations of inner and outer B-splines and 

• storage and output of the parameters which determine the basis 
functions. 

Process as claimed in claim 1, wherein, before storage and output of the 
parameters, the following step is carried out: Establishing (7) a predefinable 
weight function w and determining (8) the weight points and scaling factors. 

Process as claimed in claim 2, wherein the weight function w is established 
by a smooth transition from a constant plateau inside the simulation region 
(Q) to the value zero on the boundary (f). 
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4. Process as claimed in one of the claims 1 to 3, wherein the B-splines with at 
least one grid cell of the support contained entirely in the simulation region 
(Q) are classified as inner B-splines. 

5. Process as claimed in one of the claims 1 to 4, wherein the weight point is 



B-spline which is contained entirely in the simulation region 

6. Process as claimed in one of the claims 1 to 5, wherein the simulation region 
(Q) is defined by storage of data which can be derived from computer-aided 
engineering (CAD/CAM). 

10 7. Process as claimed in one of the claims 1 to 6, wherein the grid width h is 
automatically established using stored values obtained empirically and/or 
analytically by a pertinent first merit function. 

8. Process as claimed in one of the claims 1 to 7, wherein the degree n is 
automatically determined using stored values obtained empirically and/or 

15 analytically by a pertinent second merit function. 

9. Process as claimed in one of the claims 1 to 8, characterized by the following 



5 



chosen as the midpoint of a grid cell of the support of the corresponding 



steps: 



• assembling (9) a system of equations to be solved in the FE simulation, 



• solving (10) the system of equations, 
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• computing (11) an approximate solution, and 



• outputing (12) of the approximate solution. 



10. Process as claimed in claim 



9, wherein a multigrid process is used for the 



solution (10) of the system of equations. 



25 



11. Device for executing a process as claimed in one of the claims 1 to 10, in 
particular a computer system, with input devices (31,32,33) and output 
devices (34), storage devices (37), and a central processing unit (35,36), 



-20- 

where the regular grid structure is utilized for optimizing the computational 
process, especially by parallelization. 

12. Machine-readable data medium (38), in particular magnetic tape, magnetic 
disk, compact disk (CD) or digital versatile disk (DVD), wherein the data 
5 medium (38) stores a control program for a computer system (30), according 

to which the computer system (30) can execute a process, as claimed in one 
of the claims 1 to 10. 
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Abstract 

The invention relates to a process for increasing the efficiency of a computer 
system in finite element simulations by efficient automatic construction of suitable 
basis functions for computing approximate solutions and such a computer system. 
5 In the process as claimed in the invention, a grid covering the simulation region H 
is generated. B-splines defined thereon with supports which intersect the 
simulation region are classified into inner and outer B-splines (5). Then, coupling 
coefficients for forming linear combinations of inner and outer B-splines are 
determined (6), and the parameters which determine the resulting basis functions, 
10 are stored and output. 



Figure 3 
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List of designations and abbreviations 
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dimension of B-Splines 
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distance of point x from boundary V 




coupling coefficients 
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index set of the inner splines 
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index of an outer spline 
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rf-dimensional grid index 
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order ol convergence 
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aegree oi t5-spnnes 


Pi 


d-variate polynomial of degree n 


Qk 


support of B-spline with index k 
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bound of the support portion in 0. 


U 


solution of the differential equation 


V 


flow velocity 


w(x) 


weight function 
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WEB weighted extended B-spline 

Xi weight point in the simulation region 

Z k grid cells 

5 parameter, the width of the strip in which the weight function rises 

T boundary of the simulation region 

ft simulation region 

1 definition of the simulation region 

2 input and storage of boundary conditions 

3 establishment of control parameters 

4 determination of a grid and cell classification 

5 classification of the B-splines 

6 determination of the coupling coefficients 

7 determination of a weight function 

8 determination of weight points and scaling factors 

9 assembling of a system of equations 

10 solution of the system of equations 

11 computation of an approximate solution 

12 output of the approximate solution 

20 control points 

21 grid 

22 outer grid cells 

23 grid cells on the boundary 

24 inner grid cells 

25 stream lines 

30 computer system 
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31 


keyboard 


32 


read station 


33 


receiving station 


1A 
04 


output aevices 


35 


central control unit 


36 


central processing unit 


37 


storage device 


38 


data medium 



Erklarung zur Ubersetzung: 

Diese Ubersetzung ist eine uberarbeitete Fassung der von Lawrence B. Hanlon vom 
International Translation Center Inc. erstellten literalen Ubersetzungung. 
Korrigiert wurden neben den Fachbegriffen und fachspezifischen Formulierungen 
lediglich einige fehlerhaft ubersetzte Satze. 

Aufbauend auf der Erklarung des Ubersetzers Lawrence B. Hamilton erklaren die 
Autoren Klaus Hollig, Ulrich Reif und Joachim Wipper hiermit, dass nach bestem 
Wissen und Gewissen die literale Ubersetzung mit dem deutschen Original 
ubereinstimmt. 
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Technical Terms to be Checked 



German 


English 


A uspab emittel 


outDut device 


Bewertunffsfunktion 


merit function 


r^nniTMit prPi nTipVitiinfr 






data mpHnim 

vlGvuGv 111 v< VI 1 HI 11 


Fli n trahprn i tt.pl 


innnt dpvirp 


PjTti nf an csstati on 


receiving station 


Fpld f auadratisch / wiirfelformie ,> l 


array 


Lesestation 


read station 


Recheneinheit 


computer unit 


Speichermittel 


storage means 


Steuereinrichtung 


control unit 


Zentrale Steuereinrichtung 


central control unit 
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Technical Terms 



German 


Enelish 






R fl si <?f i i n k t i on 


Hasis fimrtinn 




oil <iy ui luuiL-co 


Opwirhtsfnnktion ?/i 


wpifrht. function in 


Gitter 


PTlH 
gnu 


Cri t tprwpi t,p 


mp^n width 


IV a li pri l n ctrI ori i ti P" 


annrfwimat.p solution 


Netz 


niGsh 


Netzgenerierung 


mesh generation 


Vernetzung 


meshing 


Rechenzeit 


computing time 


Trager 


support 


verschwinden (auf T) 


vanish (on Y) 



